AI资讯新闻榜单内容搜索-LLaMA

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报

9246 点击 2025-08-08 11:52

英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA

众所周知，老黄不仅卖铲子（GPU），还自己下场开矿（造模型）。

来自主题: AI资讯

8558 点击 2025-07-30 10:37

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

从GPT-2到Llama 4，大模型这几年到底「胖」了多少？从百亿级密集参数到稀疏MoE架构，从闭源霸权到开源反击，Meta、OpenAI、Mistral、DeepSeek……群雄割据，谁能称王？

来自主题: AI技术研报

8924 点击 2025-07-16 16:18

Meta 的 Llama 3.1 可以回忆起第一本《哈利·波特》的 42%：新的研究可能对针对生成人工智能的版权诉讼产生重大影响

近年来，众多原告——包括书籍、报纸、计算机代码和照片的出版商——起诉人工智能公司使用受版权保护的材料来训练模型。所有这些诉讼中的一个关键问题是，人工智能模型如何轻易地从原告的受版权保护的内容中逐字摘录。

来自主题: AI资讯

9090 点击 2025-06-17 17:17

刚刚2岁的Llama，「爸妈」都跑了！小扎手拆Meta AI，LeCun保持独立

面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境，小扎决定重组Meta GenAI团队，设AI产品、AGI基础和FAIR三大架构。

来自主题: AI资讯

5805 点击 2025-05-28 16:09

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta推出KernelLLM，这个基于Llama 3.1微调的8B模型，竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示，它的单次推理性能超越GPT-4o和DeepSeek V3，多次生成时得分飙升。

来自主题: AI技术研报

7925 点击 2025-05-27 18:00

英伟达再破世界纪录，每秒1000 token！刚刚，全球最快Llama 4诞生

英伟达，亲手打破了自己的天花板！刚刚，Blackwell单用户每秒突破了1000个token，在Llama 4 Maverick模型上，再次创下了AI推理的世界纪录。在官博中，团队放出了不少绝密武器。

来自主题: AI资讯

11070 点击 2025-05-23 15:58

Llama 4万亿巨兽延期，80%核心元老集体辞职？

2万亿Llama4巨兽一再推迟，又传出了80%团队辞职的惊人消息！目前，发言人已辟谣消息不准确，Meta或许迎来了至暗时刻。

来自主题: AI资讯

8267 点击 2025-05-19 09:34

小扎回应Llama 4对比DeepSeek：开源榜单有缺陷，等17B深度思考模型出来再比

Meta首届LlamaCon开发者大会开幕，扎克伯格在期间接受采访，回应大模型相关的一切。包括Llama4在大模型竞技场表现不佳的问题：

来自主题: AI资讯

9786 点击 2025-05-01 09:27

Meta宣战OpenAI，发ChatGPT超强平替App，语音交互联动AI眼镜，Llama API免费用

今天，在首届LlamaCon开发者大会上，Meta正式发布了对标ChatGPT的智能助手Meta AI App，并宣布面向开发者提供官方Llama API服务的预览版本。Meta AI App是一款智能助手，基于Llama模型打造，可通过社交媒体账号了解用户偏好、记住上下文。与ChatGPT一样，Meta AI App支持语音和文本交互，并额外支持了全双工语音交互（Full-duplex，

来自主题: AI资讯

10290 点击 2025-04-30 10:10